AI资讯新闻榜单内容搜索-Blackwell

DeepSeek做大→Mega MoE，Tri Dao团队加快→SonicMoE

近日，由普林斯顿大学 Tri Dao（FlashAttention 的一作）和加州大学伯克利分校 Ion Stoica 领导的一个联合研究团队也做出了一个超快的索尼克：SonicMoE。据介绍，SonicMoE 能在英伟达 Blackwell GPU 上以峰值吞吐量运行！并且运算性能超过了 DeepSeek 之前开源并引发巨大轰动的 DeepGEMM。

来自主题: AI技术研报

7883 点击 2026-05-04 10:17

Cursor 凌晨自曝黑科技：重写 MoE 生成机制，Blackwell 推理性能直接翻倍！网友：直接榨干B200最后一滴带宽！

今天早上，Cursor 在X上发布一条推文：“我们重建了 MoE 模型在 Blackwell GPU 上生成 Tokens 的方式，导致推理速度快了 1.84 倍。”

来自主题: AI资讯

10486 点击 2026-04-08 10:24

Sand.ai重磅更新MagiAttention，正在定义分布式Attention性能新标杆

2025 年 4 月，Sand.ai 开源了 MagiAttention v1.0.0，定义了下一代分布式 Attention 的全新设计和系统框架。历经一年的深耕，今天 Sand.ai 正式发布：MagiAttention v1.1.0，以更成熟的原生算子组件，重新定义 Hopper 与 Blackwell 两代架构分布式 Attention 的性能上限。

来自主题: AI技术研报

6501 点击 2026-03-24 16:31

英伟达最强B200算力浪费60%！普林斯顿团队出手，利用率升至71%

所有用英伟达Blackwell B200的人，都在花冤枉钱？？

来自主题: AI技术研报

7018 点击 2026-03-18 09:33

FlashAttention-4正式发布：算法流水线大改，矩阵乘法级速度

近日，深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示，在 Blackwell GPU 上，即使瓶颈截然不同，注意力机制的执行速度现在也几乎与矩阵乘法一样快了！

来自主题: AI技术研报

10100 点击 2026-03-06 15:30

Blackwell 量产，AI 芯片「美国造」真能行？

2025 年 11 月 20 日，英伟达公布最新季度财报，2025 年 Q3 营收为 570.06 亿美元，较上年同期的 350.82 亿美元增长 62%；净利润为 319.10 亿美元，较上年同期的 193.09 亿美元增长 65%。英伟达强大的吸金能力再次超出所有人的预期，三年前英伟达的同期营收仅是现在的十分之一。

来自主题: AI资讯

9187 点击 2025-11-21 16:57